Sin categorizar

Amazon y Microsoft DC despedidos por una tormenta eléctrica

El pasado 7 de agosto se desató una tormenta eléctrica en Dublín (Irlanda) que pudo provocar la desinfección de los sistemas de respaldo energético de los centros de datos de Amazon Web Services y Microsoft BPOS (Business Productivity Online Suite) ubicados en Irlanda.

En pleno verano en Dublín una tormenta eléctrica deja fuera de servicio el sistema de datos de los dos gigantes informáticos, el sistema automático de respaldo eléctrico ha explotado para ambos que han tenido que activarlo manualmente, durante horas los técnicos han trabajado para restaurar todo y siguen trabajando en ello devolviendo a los clientes la recuperación de datos en los discos EBS. Los correos electrónicos llegan a los clientes a medida que recuperan datos de snapshots o volúmenes de EBS, evidentemente el daño eléctrico ha comprometido la red de replicación del sistema de almacenamiento de EBS, como sucedió en abril (por error humano).

Este segundo caso en Amazon lamentablemente nos hace reflexionar sobre la confiabilidad del sistema de almacenamiento en bloques llamado Elastic Block Storage, es delicado, depende del ancho de banda de replicación adecuado, como arriesgar la consistencia de los datos y en los casos de instancias EC2 EBS de arranque, detener el servicio brindado sin darse cuenta (la máquina está activa), debe tener una alerta externa ya que el CloudWatch no monitorea la salud de los servicios, O al menos no directamente.

Es obvio que la caída de un rayo es un evento extraordinario, pero también hay que preguntarse cómo pudo haber caído un rayo sobre un equipo eléctrico, ya que las centrales eléctricas suelen estar muy bien equipadas con pararrayos de buen tamaño que se supone que desvían la trayectoria del rayo. Además, dos centros de datos de diferentes clientes, quizás cercanos y alimentados por la misma línea eléctrica, pero ambos equipados con el mismo sistema automático de respaldo de energía, un sistema que falló en ambos casos. Creo y espero que tanto Amazon como Microsoft puedan hacerse valer legalmente contra el fabricante del dispositivo soplado y el municipio o quien sea responsable de no haber puesto el sistema de pararrayos a la altura.

Además, es necesario reflexionar sobre el uso masivo que se hace convenientemente de los discos EBS, rápidos, no volátiles, redimensionables, snapshottatables, etc. Tal vez necesite planificar mejor copias de seguridad alternativas, sincronizaciones a S3, copias de instantáneas en otros centros de datos, etc., etc.

Author

fabio.cecaro

Leave a comment

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

This site is registered on wpml.org as a development site. Switch to a production site key to remove this banner.